#autoencoder disperso

Aprendizaje escalable de circuitos para interpretar grandes modelos de lenguaje

CircuitLasso interpreta LLMs con regresión dispersa, logrando precisión estructural a menor costo. Descubre cómo las características semánticas se propagan.

2026-06-16 · 1 min

Autoencoder Disperso Racional

Descubre cómo el Autoencoder Disperso Racional (RSAE) mejora la interpretabilidad de modelos de IA con una activación entrenable, superando a SAE tradicionales.

2026-06-16 · 1 min

Conceptos latentes cuantizados vectoriales: alternativa escalable al clustering

Descubre VQLC, alternativa escalable al clustering para descubrir conceptos en LLMs con alta coherencia.

2026-06-11 · 2 min

Sondas dispersas y física turbia: interpretabilidad en modelos de dinámica continua

Descubre cómo un autoencoder disperso revela los desafíos de interpretabilidad en un modelo fundacional de dinámica continua y sus discrepancias físicas.

2026-06-11 · 2 min

SAEExplainer: Interpretación SAE con optimización por activación

SAEExplainer optimiza la interpretación de características SAE usando preferencias guiadas por activación, reduciendo alucinaciones y mejorando causalidad.

2026-06-09 · 1 min

Transformer basado en conjuntos para compensación atmosférica hiperespectral LWIR

Transformer ligero estima transmisión y radiancia atmosférica en imágenes hiperespectrales LWIR, mejorando la compensación sin supervisión de ubicación.

2026-06-09 · 2 min

Autointerpretación: adaptadores ligeros entrenados en pares vector-etiqueta

Cómo adaptadores ligeros entrenados en pares vector-etiqueta logran autointerpretación que supera etiquetas y revela razonamiento implícito.

2026-06-03 · 2 min

Autoencoder Disperso a Nivel de Paso para Interpretar Razonamiento

Descubre cómo el autoencoder disperso a nivel de paso (SSAE) desentraña el razonamiento de los LLMs, revelando información sobre corrección y lógica. Ideal para interpretabilidad en IA.

2026-06-02 · 1 min

Latent Reward Steering: Marco Adaptativo para Comportamientos Cognitivos en LLMs

Descubre cómo Latent Reward Steering optimiza el razonamiento de LLMs al promover comportamientos cognitivos implícitos.

2026-06-02 · 3 min